
#导包
import numpy as np
import pandas as pd
#todo 1 定义函数 data_preprocessing() ,对数据做预处理操作
def data_preprocessing(path):
    """
    思路：
        1:获取数据源
        2:时间格式化 转换为 2015-07-31 00:00:00
        3:按照时间升序排序
        4:去重
    :return:
    """

    data=pd.read_csv(path)

    data.drop_duplicates(inplace=True)
    # print(f"data:{data}")
    return data
if __name__ == '__main__':
    data_preprocessing("../data/train.csv")